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Verfahren und Vorrichtung zur Digitalisierung sowie zur Datenkomprimierung 
analoger Signale 



Die vorliegende Erfindung betrifft ein Verfahren sowie eine Vorrichtung zur 
Digitalisierung analoger Signale und ein Verfahren sowie eine Vorrichtung zur 
Datenkomprimierung analoger Signale. 

Viele Bereiche der digitalen Nachrichtenubertragung haben das gemeinsame 
Ziel, ein zunachst analog vorliegendes Quellensignal (Messwerterfassung, 
Audiosignalverarbeitung in Studioqualitat. usw.) unter Ausnutzung der Vorteile 
der digitalen Ubertragung zu einem Empfanger zu transportieren, urn es dort 
in Form eines analogen Ausgangssignals wiederzugeben. Hierfur muss das 
Analogsignal zum einen digitalisiert bzw. quantisiert werden, zum anderen 
muss eine entsprechende Datenkompression erfolgen, urn das Signal bei 
moglichst guter Qualitat uber ein digitales Obertragungssystem mit begrenzter 
Rate zu ubertragen. Nach einer PCM-Encodierung werden ublicherweise 
Verfahren zur Datenkompression angewendet, die Redundanz innerhalb des 
Quellensignals sowie Irrelevanz bzgl. spezieller Eigenschaften des 
Konsumenten des Signals ausnutzen. Die zahlreichen bereits existierenden 
Verfahren zur Digitalisierung analoger Quellensignale verfolgen teilweise 



grundsatzlich verschiedene Ansatze, sie alle lassen sich jedoch in zwei 
Hauptkategorien einteilen: 

i) Verfahren, bei denen die rekonstruierte Wellenform die ursprungliche 
Wellenform sehr nahe approximiert, d.h. es erfolgt keine Ausnutzung von 
Irrelevanz. Wir verwenden hier den Begriff ..wellenformerhaltend" anstelle des 
oft angewendeten Begriffs „verlustlos" in Bezug auf die Weilenformcodierung, 
da die Digitalisierung eines analogen Signals bei einer begrenzten Datenrate 
prinzipiell nicht ..verlustlos" ist (d.h. unendliche Entropie einer kontinuierlichen 
Zufallsvariable). 

ii) Nicht wellenformerhaltende Verfahren. Sie sind beispielsweise im 
Audiobereich von entscheidender Bedeutung, da hier oftmals nur der 
subjektive Horeindruck am Empfangerausgang entscheidend ist (z.B. 
Ausnutzung psychoakustischer Maskierungseffekte). Hier spielen 
Wellenformveranderungen (Amplituden- und Phasenverzerrungen), die das 
Signal durch Quantisierung und Komprimierung erfahrt, i.d.R. nur eine 
untergeordnete Rolle. Gblicherweise fuhrt eine Signalverarbeitung unter 
Ausnutzung von Irrelevanz zu einer rekonstruierten Wellenform, die sich sehr 
stark von der ursprunglichen Wellenform unterscheidet und zudem oft mit 
einer grolien Signalverzbgerung behaftet ist (z.B. aufgrund von 
Spektraltransformationen oder aquivalenten blockbasierten Methoden). Die 
Obertragungsqualitat eines solchen Verfahrens lasst sich nicht durch einen 
Storabstand 10 log 10 (SNR), SNR: Signal to Noise Ratio, im klassischen Sinne 
messen; sie muss vielmehr durch aufwendige Hortests mit trainierten 
Personen ermittelt werden. Fur viele Anwendungsbereiche (z.B. in der 
Messtechnik, Aufzeichnung von Wellenformen fur eine weitere 
Signalverarbeitung zu einem spateren Zeitpunkt, Echtzeit-Signalubertragung 
unter Anwendung digitaler Modulationsverfahren, die keine nennenswerte 
Signalverzogerung zulassen z.B. fiir drahtlose digitale Buhnenmikrophone) 
sind derartige Signalcodierungsverfahren jedoch ganzlich unbrauchbar. 



Es ist somit Aufgabe der vorliegenden Erfindung, ein Verfahren und eine 
Vorrichtung zum Digitaiisieren sowie zum Komprimieren analoger Signale mit 
verbesserter Qualitat vorzusehen. 

Diese Aufgabe wird durch ein Verfahren zum Digitaiisieren analoger Signale 
gemaft Anspruch 1, durch eine Vorrichtung zum Digitaiisieren analoger 
Signale gemaft Anspruch 12, durch ein Verfahren zum Komprimieren 
analoger Signale gemaft Anspruch 8 und eine Vorrichtung zum Komprimieren 
analoger Signale gemaft Anspruch 17 gelost. 

Somit wird ein Verfahren zur Digitalisierung analoger Quellensignale 
vorgesehen, bei dem eine D-dimensionale spharisch logarithmische 
Quantisierung der analogen Quellensignale erfolgt. 

Gemaft einem Aspekt der vorliegenden Erfindung wird ebenfalls ein Verfahren 
sowie eine Vorrichtung zum Komprimieren analoger Quellensignale 
vorgesehen, bei dem eine Digitalisierung analoger Quellensignale gemaft dem 
oben beschriebenen Verfahren erfolgt und wobei eine differenzielle 
Pulscodemodulation durchgefuhrt wird. 

Somit wird ein wellenformerhaltendes Verfahren vorgesehen, welches die 
folgenden Anforderungen erfullt: a) geringe Datenrate durch Ausnutzung von 
gunstigen Packungseigenschaften mehrdimensionaler Gitter 

(Vektorquantisierung) sowie Ausnutzung von Abhangigkeiten in der Folge der 
Abtastwerte aus dem Quellensignal, b) extrem hoher Dynamikbereich, d.h. 
das SNR ist konstant uber einen sehr groften Aussteuerbereich von z.B. 60 
dB und mehr bzgl. der Kurzzeitvarianz eines analogen Quellensignals, c) 
hoher segmentweiser objektiv messbarer Storabstand fur kurze Segmente 
von Abtastwerten, vorzugsweise im Sinne des Verhaltnisses von Varianz des 
Nutzsignals zum mittleren quadratischen Fehler, d) Unempfindlichkeit 
gegenuber speziellen Signalparametem wie z.B. segmentweise 
Wahrscheinlichkeitsdichtefunktion usw. und am wichtigsten e) Einfuhrung 



einer extrem geringen Signalverzogerung in der Grofienordnung weniger (bis 
zu 10) Abtastperioden. 

Die Erfindung beruht auf dem Gedanken, ein Verfahren zur hochauflosenden, 
wellenformerhaltenden Digitalisierung analoger Signale vorzusehen, wobei die 
ubliche skalare logarithmische Quantisierung auf mehrdimensionale 
Kugelkoordinaten ubertragen wird und sich somit die hieraus resultierenden 
Vorteile wie z.B. ein konstanter Storabstand uber einen extrem hohen 
Dynamikbereich bei einem sehr geringen Verlust in Bezug auf die Rate- 
Distortion-Theorie ergeben. Urn die im Quellensignal vorhandenen 
statistischen Abhangigkeiten fur einen weiteren Storabstandsgewinn 
ausnutzen zu konnen, wird die Differentielle Pulscodemodulation (DPCM) mit 
spharisch logarithmischer Quantisierung kombiniert. Das resultierende 
Verfahren erzielt eine wirksame Datenreduktion mit einem hohen Langzeit- 
sowie Kurzzeitstorabstand bei extrem geringer Signalverzogerung. 

Weitere Ausgestaltungen der Erfindung sind Gegenstand der Unteranspruche. 

Die Erfindung wird nachfolgend unter Bezugnahme auf die beigefugte 
Zeichnung naher erlauterl 

Figur 1 zeigt eine Darstellung der Proportionalitat eines 

Kreisbogensegmentes zum Radius, 
Figur 2 zeigt ein Diagramm zur Veranschaulichung der Anzahl von 

Quantisierungszellen, die einem Radius zugeordnet sind, 

normalisiert auf die Zellenanzahl pro Absolutbetrag eines 

Abtastwertes in skalarer Quantisierung, 
Figur 3 zeigt einen Graphen zur Veranschaulichung eines 

Storabstandverlustes bei verschiedenen A - Werten, 
Figur 4 zeigt einen Graphen zur Veranschaulichung des 

Storabstandes gemafi der vorliegenden Erfindung, 
Figur 5 zeigt ein Blockschaltbild eines DPCM-Encoder mit 

Ruckwartspradiktion gemafi der vorliegenden Erfindung, 



Figur6 zeigt einen Graphen zur Veranschaulichung des Signal- 

Rauschabstandes gemafi einem weiteren 

Ausfuhrungsbeispiel der Erfindung, und 
Figur7 zeigt Graphen der Signalpegel und des Signal- 

Rauschabstandes gemaft dem weiteren Ausfuhrungsbeispiel 

der Erfindung. 



Das Ziel der logarithmischen Quantisierung ist eine hohe Dynamik des 
Quantisierers, also ein weiter Bereich des mittleren Signalpegels, in welchem 
das SNR und somit der maximale relative Quantisierungsfehler 
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konstant ist. Hierbei bezeichnet Aq t die Breite des z-ten 
Quantisierungsintervalles und r t den jeweiligen Rekonstruktionswert. Diese 
Aufgabe fuhrt zu der logarithmischen Quantisierung z.B. im Sinne des A- 
Laws gemaft K. Trondle, R. Weift. Einfuhrung in die Pulscodemodulation. 
Oldenbourg Verlag, Munich, 1974. Fur den Bereich mittlerer Aussteuerung 
ergibt sich fur R » 1 folgender Storabstand gemafi N. S. Jayant, P. Noll. 
Digital Coding of Waveforms. Prentice-Hall, Englewood Cliffs, New Jersey, 
1984. 



10log 10 (SNR) = R ■ 6,02dB + 101og l0 , (\) 



wobei R die mittlere Rate der Quantisierung (bit/Abtastwert) bezeichnet und 
A den ublichen Parameter der logarithmischen Quantisierung darstellt; d.h. 
der maximale relative Fehler ist fur Abtastwerte mit einem Betrag > MA 
(bezogen auf einen Signalbereich der Quantisierung von -1 bis +1) konstant. 
Damit wird ab einem mittleren Signalpegel des Quellensignals von 



-5, := 201og 10 (l/^)dB 



(2) 



ein Storabstand gemad (1) erreicht. Der Wert B 1 charakterisiert damit den 
Dynamikbereich der logarithmischen Quantisierung. Innerhalb dieses 
Dynamikbereiches ist der Storabstand zudem ganzlich unabhangig von der 
Wahrscheiniichkeitsdichtefunktion (WDF) des Quellensignals, so dass das 
Verfahren universell einsetzbar ist. Allerdings stellt der Term 
101og 10 (3/(l + ln(^)) 2 ) im Vergleich zu einer gleichmafiigen Quantisierung bei 
Vollaussteuerung durch ein gleichverteiltes Signal gewissermalien einen 
"Stdrabstands-Verlust" durch Kompandierung dar, der fur einen grofcen 
Dynamikbereich zu bezahlen ist. 

Nachfolgend wird eine Quantisierung in Kugelkoordinaten in D Dimensionen 
beschriebenen. 

Die Spharisch logarithmische Quantisierung gehdrt zur Familie der 
Vektorquantisierungsverfahren (von z.B. R. M. Gray, David L. Neuhoff. 
Quantization. IEEE Transactions on Information Theory, pp. 2325-2383, Oct. 
1998, Manfred Herbert. Lattice-Quantisierung von Sprach- und 
Sprachmodellsignalen. Ausgewahlte Arbeiten uber Nachrichtensysteme, Nr. 
79, Editor: H.-W. Schufiler, Erlangen 1991). Durch eine kugeldichte Packung 
in vielen Dimensionen konnen betrachtliche Storabstandsgewinne bei der 
Quantisierung erzielt werden, auch wenn keine statistischen Abhangigkeiten 
innerhalb der Signale ausgenutzt werden konnen. Bei spharischer 
Quantisierung wird ein Vektor x := (x lt ...,x D )mH D Abtastwerten in 
kartesischen Koordinaten durch Polarkoordinaten u := (<p x ,...,<p D _ it r) 
ausgedruckt. Die D - 1 Winkel <p. sowie der Radius r sind durch folgende 
Gleichungen gegeben (j: imaginare Einheit, arg (•) : Argumentfunktion, welche 
den Winkel einer komplexen Zahl im Bogenmali angibt): 



<P\ = arg(jc, + jx 2 ) e[-n,+7c) 



<Pi = arg 



Z>/ +Jx M 



/=i 



2'2 



(3) 
(4) 



/e{2,...,Z)-l}. 



- 2 = Z*i 



(5) 



Die Rekonstruktion der kartesischen Komponenten aus dem Vektor u erfolgt 
hieraus gemali 



x, = r -6 w -sin (<?,._,), i € {Z),...,2} 
x, = r • 6, • cos (p, ) = r • 6 0 , 



(6) 
(7) 



mit den Radien b, der "Breitenkreise" der Einheitskugel (Radius 1): 



V, = 1 



D-l 

*/ '= 1 • n cos C^/) , ie{Z>-2,...,0}. 

/=/+! 



(8) 
(9) 



Damit ist ausgehend von cp D _ x eine aufwandsgunstige rekursive Darstellung 
gefunden. Eine effiziente Implementierung von Vor- und Rucktransformation 
ist mit Hilfe des sog. CORDIC-Algorithmus (welcher in Voider, Jack. The 
CORDIC Trigonometric Computing Technique. IRE Trans. Electronic 
Computing, Vol EC-8, pp. 330-334, Sept. 1959 beschrieben ist) mit geringer 
Komplexitat moglich. 



Nachfolgend wird die Spharisch logarithmische Quantisierung beschrieben: 



Damit bei der Quantisierung in Polarkoordinaten die Vorteile der 
logarithmischen Quantisierung, d.h. die Unabhangigkeit des SNR von der 
WDF des Quellensignals, weiterhin genutzt werden konnen, wird nun der 
Betrag (Radius) logarithmisch gemafi den Vorschriften des A -Law quantisiert. 
Die Winkel (p t werden individuell gleichmaliig quantisiert, jeweils mit Wahl der 
Quantisierungsintervalle in Abhangigkeit der bereits quantisierten Winkel 

(Pt, I <= {/* + 1,/ + 2.....D - 1} hoherer Ordnungen, wie sie auch fur die 
Rekonstruktion verwendet werden. Somit wird eine sehr einfache 
Implementierung der Quantisierung und der Signairekonstruktion erzielt, 
wobei durch die iterative Vorgehensweise gemali (3) bis (9) eine schrittweise 
Verarbeitung der einzelnen Koordinaten wie im Fall skalarer Quantisierung 
bewahrt wird. 

Aufgrund der Proportionalitat der Lange eines Kreisbogensegmentes zum 
Radius sind die Anforderungen an die logarithmische Quantisierung, d.h. die 
Proportionalitat der Grolie eines Quantisierungsintervalls zum Signalwert, 
bereits fur gleichmaftige Quantisierung der Winkel erfullt. Fig. 1 zeigt ein 
einfaches Beispiel fur zwei Dimensionen D = 2. Der zweite Term in (1) muss 
somit nur fur eine der insgesamt D Dimensionen bezahlt werden, hierin liegt 
die wesentliche Ursache fur die Gewinne mittels spharisch logarithmischer 
Quantisierung. 

Urn die Implementierung der Quantisierung in Kugelkoordinaten zu 
vereinfachen, gehen wir von naherungsweise kubischen Quantisierungszellen 
aus, d.h. die Oberflache einer D-dimensionalen Kugel mit Radius 1 wird durch 
ein Netz aus D - 1-dimensionalen (Hyper-)Wurfeln quantisiert. Wie 
nachfolgend gezeigt wird, ergibt sich durch diese suboptimale Quantisierung 
der Kugeloberflache im Vergleich zu einem optimal dicht gepackten Gitter 
jedoch im Grenzwert D - oolediglich ein Verlust von 




-9 



UP 



also ein Ratenverlust von ca. 1/4 bit/Abtastwert, der zugunsten einfacher 
Implementierbarkeit hingenommen wird. 

Im folgenden wird beschrieben, wie die Aufteilung der M D (d.h. M := 2 R ) pro 
Quantisierungsschritt zur Verfugung stehenden Quantisierungsstufen auf die 
einzelnen Quantisierungsintervalle fur den Radius und die Oberflache der D - 
dimensionalen Einheits(hyper-)kugel in optimaler Weise vorgenommen wird. 

Fur den logarithmischen Bereich 

der A -Law-Vorschrift gelte wie ublich die folgende Kompressorkennlinie 



10 



Kr) = r 0 



c • In — + 1 



mit c := 



1 



1 + kiA 



(10) 



Fur deren Ableitung gilt: 



k\ r ):~ d ^ (r) = C ' r ° 
dr r 



(ii) 



A bezeichnet den freien Parameter des A -Law und r 0 wird als noch naher zu 
beschreibender Normierungsfaktor fur den Radius eingefuhrt. Mit M D 
15 Quantisierungsintervallen fur den Radius (O-te Komponente des Vektors u ) 
ergibt sich fur die Breite der Quantisierungszelle in Richtung des Radius 



Ar(r) « ^ = 1 r 

M D -k\r) M D -c " 



(12) 
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Man beachte, dass Ar(r) im betrachteten Bereich unabhangig von r 0 ist. 

Urn bei der Quantisierung in Polarkoordinaten ein ahnliches 
Ubersteuerungsverhalten zu erhalten wie bei kartesischen Koordinaten, wird 
der Maximalwert r 0 fur den Radius derart normiert, dass die somit entstehende 
D-dimensionale Kugel das gleiche Volumen besitzt wie ein D-dimensionaler 
Wurfel der Kantenlange 2 (entsprechend einem Quantisierungsbereich 

x, e [- l;l] in jeder Dimension), d. h. V Kugel = 



Wttrfel 



mit dem Volumen a D der O-dirnensionalen Einheitskugel gemafi J. H. 
Conway and N. J. A. Sloane. Sphere Packings, Lattices, and Groups. 
Springer-Verlag, 3rd edition. 



Damit gilt: 



mit r 0 >1 VZ)eIN (14) 



Um die Bestimmung des resultierenden Storabstandes zu vereinfachen, wird 
im Folgenden r = 1 gesetzt, d.h. es werden diejenigen Quantisierungszellen 
betrachtet, welche auf der Oberflache einer Kugel mit Einheitsradius liegen. 
Dies ist ohne Beschrankung der Allgemeinheit moglich, da das SNR aufgrund 
der logarithmischen Quantisierung im Bereich 



-11 - 



— < r < r, 



o 



A 

unabhangig vom Radius ist. Fur die Breite der Quantisierungszellen erhalt 
man nun 



M D -c 



(15) 



5 Durch die bereits angesprochene gleichmaliige Winkelquantisierung wird die 
Oberflache der D-dimensionalen Einkeitskugel in M ^ Zellen eingeteilt, welche 
jeweils die Form von D - 1-dimensionalen Wurfeln besitzen. Fur die 
Oberflache dieser D - 1-dimensionalen Kugel gilt gemaU J. H. Conway and N. 
J. A. Sloane. Sphere Packings, Lattices, and Groups. Springer-Verlag, 3rd 
10 edition: 

S = p D -r D - y mit j3 D =Da D . (16) 

Nachfolgend wird die Aufteiiung der Quantisierungsstufen auf Radius und 
Winkel beschrieben. 

Fur eine faire Aufteiiung der M° zur Verfugung stehenden 
15 Quantisierungszellen auf Radius und Oberflache der Einheitskugel gelten die 
folgenden Uberlegungen: im Hinblick auf die Approximation durch kubische 
Quantisierungszellen, d.h. ungefahr gleiche Abmessungen der 
Quantisierungszellen in alien Dimensionen (Radius und 
Kreisbogensegmente), muss die Oberflache der Einheitskugel (r = 1) in M p 

20 gleiche (D - fj-dimensionale Wurfel mit identischer Kantenlange A unterteilt 
werden: 
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S = P D = 



M p - A' 



D-\ 



(17) 



Da M = 2 R Intervalle pro Abtastwert zur Verfugung stehen, muss zusatzlich 



gefordert werden. 

Mit (15), (17) und (18) erhalt man fur die Anzahl der fur die Quantisierung des 
Radius zur Verfugung stehenden Quantisierungsintervalle 



In Fig. 2 sind die Quotienten M D /(M/2) der Anzahl an Quantisierungszellen, 
die dem Radius gewidmet sind, normalisiert auf die Zellenanzahl pro 
Absolutbetrag eines Abtastwertes in skalarer Quantisierung (D = 1), 
gegenuber der Dimensionszahl fur mehrere Beispiele des Parameters A der 
A -Law-Kompandierung aufgetragen. Die Werte von A sind derart gewahlt, 
dass die Anwendung der A -Law-Kompandierung zu kleinsten 
Quantisierungsintervallen fuhrt, die urn den Faktor 

2 A,, 5 A*eIN kleiner sind, als dies bei gleichmafJiger Quantisierung bei 
identischer Gesamtintervallzahl der Fall ware: 



M^M D -M D 



(18) 




\ID AD-\yo ' 



(19) 



Ar(r <l/A) = 2" Art — — , d. h. 

M D 



(20) 
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> dm 



1 + ln/J 



(21) 



Demzufolge ist die Auflosung fur kleine Werte von rum An bit erhoht. 

Fig. 2 zeigt, dass spharisch logarithmische Quantisierung bis uber den Faktor 
8 hinaus mehr Intervalle dem Radius zuordnet, als eine skalare Quantisierung 
mit einer aquivalenten Auflosung im Bereich sehr kleiner Signalwerte. Daher 
wird ein Gewinn von 3 bit/Abtastwert oder 18 dB fur spharisch logarithmische 
Quantisierung in diesem Bereich erreicht. 

Unter Verwendung von (15) erhalt man die Kantenlange der Quantisierungs- 
zellen auf der Oberflache der Einheitskugel: 



A = 



M 



c 



(22) 



Die Konstante c ist durch den gewahlten Dynamikbereich bestimmt, siehe (2) 
und (10). 

Die aktuelle gleichmafiige Quantisierung der Winkelvariablen fur gleiche 
Kreisbogensegmente auf der Einheitskugel erhalt man mit Hilfe der rekursiven 
Gleichungen (8) und (9). Wir haben M, Intervalle fur die Koordinate (p. zur 
Verfugung: 



M 



D-l 



(23) 



K-b, 



(24) 
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fur z{D-2,D-3,...,2} 



M l (<p 2 ,...,<p D _ i ) = 



2tt ■ b l 



(25) 



mit |_*J e IN : groftte ganze Zahl < x mit x <= IR + und b, entsprechend (8) 
und (9) fur quantisierte Winkel q> i . 

Es gilt zu beachten, dass die Anzahl M, der Quantisierungsintervalle in der 

Dimension / eine Funktion der in den Dimensionen /' + 1 D - 1 ausgewahlten 

Quantisierungszelle ist und daher ausgehend von M D -i iterativ berechnet 
werden kann. Eine Berechnung im Voraus ist nicht moglich. 

Die Zuordnung eines Indexes N e {o,l,-.;M D -l} zu der aktuellen 
Quantisierungszelle sowie die Rekonstruktion kann durch Anwendung 
verketteter Lookup-Tabellen, wie sie aus dem Shell Mapping, z.B. gemali 
Robert F. H. Fischer. Precoding and Signal Shaping for Digital Transmission, 
pp. 258-281, John Wiley & Sons, Inc., New York, 2002. ISBN 0471 22410 3 
bekannt sind, durchgefuhrt werden: 



Die Zuordnung eines Indexes zum Radius ist unabhangig vom Zellenindex auf 
der Einheitskugel, somit kann nunmehr das Problem der Indexzuordnung fur 
die Oberflache der Einheitskugel betrachtet werden. 

Die Startnummer des Indexes ist 0, die maximale Endnummer des Indexes ist 
M v - 1 , entsprechend der Anzahl an Quantisierungszellen auf der Oberflache 
der Einheitskugel. M D -i ist die Anzahl der Unterkugeln der Dimensionalitat 
D - 1 und kann aus (23) berechnet werden. Zugunsten einer schnellen 
Implementierung wird eine Lookup-Tabelle erster Ordnung mit M D -i Eintragen 
Wo Mwo-1-1 verwendet. Hierbei bezeichnet N, den kleinsten Index aller Zellen, 
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die zu dem /-ten Quantisierungsinten/all fur den Winkel (p D _ x gehdren: 



^o=0 (26) 



N m = Tj M d-i\ Vd-\ = 

v=o v Ay 



ie{0 9 ...,(M D _ x -2)} 

Somit existieren /V, +1 - A/, Zellen fur einen festgesetzten /-ten Wert von q> D _ x . 
Fur jedes N„ wird eine Lookup-Tabelle zweiter Ordnung angelegt, welche die 
indizes O u enthalt, die wiederum den kleinsten Index aller Zellen des y-ten 
Quantisierungsintervalls fur den Winkel <p D _ 2 innerhalb der D - 1- 
dimensionalen Unterkugel bezeichnen, auf die N, sich bezieht. 

°i.o = 0 (27) 



j 



v=0 



/ 6 {0,..,(M^-1)}, 




Diese Vorgehensweise fuhrt zu D - 2 Ordnungen von verketteten Lookup- 
Tabellen, um die D - 1 Winkel zu indizieren (die Lookup-Tabelle der Ordnung 
O - 1 fur den Winkel q> x wurde aufeinanderfolgende Zellenindizes enthalten 
und muss deshalb nicht tabellarisiert werden). 
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Nachfolgend wird das Quantisierungsgerausch und der Storabstand naher 
betrachtet. 

Solange eine ausreichend grolie Anzahl an Quantisierungszellen in D 
Dimensionen vorliegt, darf die ubliche Approximation eines gleichverteilten 
Quantisierungsfehlers innerhalb dieser kubischen Zellen angewendet werden. 
wobei jede Zelle durch ihren Mittelpunkt reprasentiert wird. Fur die Leistung 
des Quantisierungsgerausches gilt naherungsweise 



A 2 „ 

12- D - (28) 



Die spharisch logarithmische Quantisierung erzwingt A(r) = A-rin alien 
Dimensionen fur — < r < r 0 , daher gilt 



SNR= fr = F(D)M 2 (29 ) 

A 2 • r 2 • — 
12 



mit F(D) := — 
D 



(30) 



siehe auch (22). Wie gewunscht ist das SNR unabhangig von der Varianz des 
Signals in diesem Bereich. 

Durch Einsetzen von (13) und (16) erhalt man: 



D D 



Betrachtet man (29), so kann F (D) als Verlust bezuglich der Rate-Distortion- 
Schranke fur i.i.d. gauft'sche Zufallsvariablen (6 dB-pro-Bit-Regel) interpretiert 
werden. Dieser Zusammenhang ist in Fig. 3 fur verschiedene Werte von A 
dargestellt. 

Mit Hilfe der Stirlingschen Naherung 



berechnen, der den Verlust gegenuber der Rate-Distortion-Schranke 
darstellt, welcher durch die suboptimalen kubischen Quantisierungszellen 
(gegenuber (D - 1)-dimensionalen Hyperkugeln fur die Quantisierung der 
Oberflache einer D-dimensionalen Einheitskugel und D oo) verursacht 
wird. Mit anderen Worten: Durch spharisch logarithmische Quantisierung ist 
es moglich, den in (1) beschriebenen Verlust infolge der Kompandierung bis 
auf lediglich 1,53 dB wieder zu kompensieren. Somit ist es durch die Wahl 
des Parameters A und D theoretisch moglich, einen beliebig grofien 
Dynamikbereich (Bereich konstanten Storabstandes uber dem mittleren 
Signalpegel) zu erzielen, ohne nennenswerte Verluste im maximal 
erzielbaren Storabstand in Kauf nehmen zu mussen. Der asymptotische 
SNR-Verlust von 1,53 dB entspricht einem Ratenverlust von 1/4 
bit/Abtastwert, der zugunsten einer extremen Reduzierung der Komplexitat 
akzeptiert werden kann. 

Da im Sinne der Zielsetzung einer logarithmischen Kompandierung bewusst 
von keiner Kenntnis einer Wahrscheinlichkeitsdichtefunktion fur i.i.d. 
Quellensignalwerte ausgegangen wird, stellt aber wiederum die Rate- 




lasst sich der Grenzwert 



limW0 = — = -i,53dB 

D->oo ft e 



(32) 
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Distortion-Funktion fur die gaufi'sche Zufallsvariable die untere Schranke fur 
die erreichbare Rate (bzw. Verzerrung) bei gegebener Verzerrung (bzw. Rate) 
dar (Berger's upper bound der Rate-Distortion-Function gemafi T. Berger. 
Lossy Source Coding. IEEE Transactions on Information Theory, pp. 2693- 
2723, Oct. 1998). Somit sind unter den hier gestellten Anforderungen und 
Einschrankungen uber 1,53 dB bzw. 1/4 bit/Abtastwert hinausgehende 
Verbesserungen ohnehin nicht mehr moglich. 

Fig. 4 zeigt als Beispiel den Abstand des Storabstandes von der Rate- 
Distortion-Schranke R • 6dB abhangig vom mittleren Signalpegel (10 log 10 
(Varianz)) i.i.d. gauftverteilter Zufalisvariablen bei A = 48270 fur 
unterschiedliche Dimensionszahlen der spharisch logarithmischen 
Quantisierung. Diese Simulationsergebnisse erfullen exakt die theoretische 
Analyse gemafi Fig. 3. Auf den ersten Blick scheinen die sehr grofien Werte 
fur A , wie sie in den Beispielen der Fig. 3 und 4 sowie in den nachfolgenden 
Beispieien verwendet werden, unrealistisch und nicht implementierbar. Es 
gilt hier jedoch zu beachten, dass gewdhnlich wesentlich mehr als M 
Intervalle mittels (19) fur die Quantisierung des Radius (M D > M/2) verwendet 
werden, siehe Fig. 2. Selbst fur sehr niedrige Raten, z.B. R = 4 bit/Abtastwert 
existieren somit sehr feine Quantisierungsintervalie fur den Radius. Daruber 
hinaus stellt (10) eine invertierbare Funktion fur jeden Wert von A > 1 dar 
und ist somit in jedem Fall sehr gut fur die Spezifizierung eines bestimmten 
nichtgleichmaGigen Quantisierers geeignet. Vorzugsweise sollte dieser 
Ansatz fur echte Wellenformcodierung bei extrem geringer 
Signalverzogerung nicht fur Raten unter 3 bit/Abtastwert angewendet 
werden. 

Daruber hinaus wird in Fig. 4 deutlich, dass durch zwei Effekte mit 
wachsender Dimensionszahl bei konstantem Parameter A der 
Dynamikbereich stark ansteigt. Zum einen nimmt der Normierungsradius r 0 zu, 
zum anderen wirkt die Begrenzung der logarithmischen Kompression nur auf 
eine Dimension, auf den Radius, wahrend fur D - 1 Dimensionen die 
Proportionalitat der Ausdehnung der Quantisierungszelle zum Signalwert 



(-Bogenlange zu Radius bei fixer Winkeldifferenz) auch fur kleinste 
Signalwerte erhalten bieibt. Somit erweitert sich der Dynamikbereich in D 
Dimensionen naherungsweise auf 

B D » B x +20Iog 10 (r 0 ) + 101og 10 (i)). (33) 

Zudem steigt aufgrund des Mittelungseffektes innerhalb von jeweils D Werten 
die Ubersteuerungsfestigkeit, wodurch eine weitere Vergrofterung des 
Dynamikbereiches erzielt wird. Im Grenzwert (D 00) ergibt sich ein unendlich 
grofter Dynamikbereich fur jeden beliebigen Wert von A . 

Die strukturbedingte Verzogerung von spharisch logarithmischer 
Quantisierung betragt, wie fur jede Vektorquantisierungsmethode, exakt D 
Abtastwerte. Wie aus Fig. 3 und 4 ersichtlich ist, wird der groftte Teil des 
moglichen Gewinns bereits bei sehr kleinen Werten von D (bis 5) erzielt. 

Nachfolgend wird die Kombination von einer spharischen Quantisierung und 
DPCM beschrieben. 

Korrelationen zwischen den Abtastwerten q[k] werden mittels differentieller 
PCM (DPCM) effizient ausgenutzt, siehe Fig. 5. Ein Pradiktionsfehlersignal 
x[k]w\rd durch die Subtraktion von pradizierten Abtastwerten, die mittels eines 
linearen Pradiktorfilters H P (z) - z" 1 aus rekonstruierten Abtastwerten q[k] 
gewonnen werden, erzeugt. Fur einen idealen Pradiktor zeigt die 
Pradiktionsfehlersequenz x[k] ein weifies Leistungsdichtespektrum (PSD) 
sowie minimale Varianz. Ublicherweise ist dieses Pradiktorfilter adaptiv, urn 
sich an eine nichtstationare Quelle anzupassen. Vorliegend werden nur 
Beispiele fur ein festes Pradiktorfilter vorgestellt, mit dem Ziel, die Interaktion 
mit spharisch logarithmischer Quantisierung moglichst einfach zu 
beschreiben. Beispielsweise bei Audiosignalen bieten sich bereits sehr kurze, 
feste Pradiktionsfehlerfilter (entworfen bzgl. eines Kompromiss-Kriteriums) 
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ublicherweise Gewinne von mehr als 18 dB bei einer Abtastfrequenz von 44,1 
kHz. Selbst segmentweise Gewinne, gemittelt uber 6000 Abtastwerte 
(0,136s), von weniger als 15 dB lassen sich nur sehr selten beobachten, siehe 
hierzu Fig. 7 im Vergleich mit Fig. 3. Daruber hinaus ist der Gewinn durch 
adaptive Pradiktion begrenzt, falls die Signalverzogerung auf einige wenige 
Abtastwerte beschrankt ist und merkliche Effekte, welche durch 
Aktualisierungen der Koeffizienten hervorgerufen werden, vermieden werden 
miissen. Selbstverstandlich kann das folgende Material direkt auf adaptive 
Pradiktion verallgemeinert werden. 

Es gilt zu beachten, dass ein SNR-Gewinn, ausgedruckt durch eine 
Verringerung des mittleren quadratischen Fehlers zwischen originalen und 
rekonstruierten Abtastwerten, bei Anwendung der sogenannten 
Riickwartspradiktion, wie in Fig. 5 dargestellt, moglich ist. 

Bei logarithmischer Quantisierung ist das SNR des Pradiktionsfehlersignals 
x[k] unabhangig von seiner Varianz oder anders ausgedruckt, die Leistung 
des Quantisierungsgerausches ist proportional zur Signalleistung. Somit kann 
der Pradiktionsgewinn, d.h. der Quotient der Varianzen von q[k] und x[kj, 
direkt in einen SNR-Gewinn uberfuhrt werden. Damit ist logarithmische 
Quantisierung eine gute Wahl fur DPCM. Hinzu kommt, dass durch DPCM - 
verglichen mit PCM - keine weitere systembedingte Signalverzogerung erfolgt. 
da ein optimales Pradiktionsfehlerfilter fur maximalen Pradiktionsgewinn 
prinzipiell kausal und strikt minimalphasig ist (vgl. L. Pakula and S. Kay. 
Simple Proofs of the Minimum Phase Property of the Prediction Error Filter, 
IEEE Transactions on ASSP, vol. 31, 1983) und daher ohne strukturbedingte 
Verzogerung invertiert werden kann. 

Nachfolgend wird das Gradientenabstiegsverfahren naher beschrieben. 

Fur die Anwendung von spharisch logarithmischer Quantisierung auf DPCM 
mit Ruckwartspradiktion gilt die gleiche Problematik wie fur jede andere 
Vektorquantisierungsmethode: fur die Berechnung des aktuellen 
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Pradiktionsfehlersignalwertes x[k] mussen alle vorausgehenden 
rekonstruierten Abtastwerte q[k - /], 1=1,2,... vorliegen, fur einen hohen 
Pradiktionsgewinn sind insbesondere die unmittelbar vorausgehenden Werte 
(/ = 1, / = 2) unverzichtbar. Diese Forderung ist leider nicht vereinbar mit der 
Quantisierung von Blocken der Lange D Abtastwerte. 

Als Losung fur dieses Problem kann jede in der Literatur erwahnte Methode 
zur Kombination von Vektorquantisierung mit DPCM herangezogen werden. 
Hier wird eine Methode, in Anlehnung an das Prinzip "analysis by synthesis", 
verwendet, welches beispielsweise von CELP-Wellenformcodierungs- 
verfahren gemaft N. S. Jayant, P. Noll. Digital Coding of Waveforms. Prentice- 
Hall, Englewood Cliffs, New Jersey, 1984 bekannt ist und kombinieren diesen 
Ansatz mit einem diskreten Gradientenabstiegsverfahren. 

Urn den Widerspruch zwischen DPCM und Vektorquantisierung zu 
bewaltigen, wird die quadratische Euklidische Distanz zwischen Vektoren von 
Abtastwerten 

q[/] = (q[l ■ D], q[l-D + 1],..., q[l • D + D - 1]) (34) 

und einem entsprechenden Rekonstruktionsvektor q[l] minimiert, l = [k/D\ 
An dieser Stelle gilt es zu beachten, dass neben der spharisch 
logarithmischen Quantisierung die Berechnung des entsprechenden 
Pradiktionsfehlersignals sowie die Inversion des Pradiktionsfehlerfilters in die 
Berechnung eines Paares q,q mit einbezogen werden muss, wobei auf 
vorausgehende Rekonstruktionsvektoren q[l - m],m = 1,2,... zugegriffen wird, 
diese selbst aber unverandert bleiben. Das Ziel des Algorithmus ist es, 
diejenige Quantisierungszelle fur x[l] zu finden, fur welche die Metrik 



d 2 (q,q) = ^(q[D-l + i]-q[D-l + i]) 2 

t=0 



(35) 
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minimiert wird. Urn einen geeigneten Startwert fur den Algorithmus zu finden, 
schlagen wir vor, mit einer Vorwartspradiktion fur die aktuellen D Abtastwerte 
zu beginnen, dies entspricht einer Deaktivierung der Kette aus ADC und DAC 
in Fig. 5 bzw. der direkten Einspeisung von 
k = l-DJ'D + 1,..., l-D + D-l in das Pradiktorfilter (in Fig. 5) anstelle 
von q[k] . Nun wird der resultierende Vektor x spharisch logarithmisch 
quantisiert und dabei ein Startvektor y erzeugt, aus dem wiederum durch 
gewdhnliche Inversion des Pradiktionsfehlerfilters (DPCM-Empfangerstruktur) 
ein Vektor q folgt. Auf diese Weise kann die Metrikberechnung fur einen 
gegebenen quantisierten Vektor j^erfolgen. Ausgehend von einem aktuellen 
Rekonstruktionsvektor y. werden nun die Rekonstruktionsvektoren aller 2D 
nachsten Nachbarn y^ in D Dimensionen ermitteit sowie die zugehdrigen 

Metriken gemafi (35) berechnet und miteinander verglichen. Der Vektor mit 
der geringsten Metrik wird fur die nachste Iteration verwendet, d.h. arg min y 
d 2 {q>q m ) erzeugt eine Aktualisierung von /, wobei q. dem quantisierten 
Vektor y. entspricht und durch Inversion des Pradiktionsfehlerfilters berechnet 
wird. Existiert kein solcher Vektor, so bricht der Algorithmus ab und gibt den 
Index des zu ubertragenden Vektors y. aus. Hier ist anzumerken, dass die 
Nachbarzellen ublicherweise sehr verschiedene Indizes haben und es nicht 
trivial ist, diese Zellen zu identifizieren. Betrachten wir beispielsweise D = 3, so 
werden die Winkel des Azimuths {<p x ) bei grofien Elevationen (^ 2 nahe 
±nl2) grober quantisiert, als bei kleinen Elevationen (<p 2 nahe 0), weil 
letztere einen grofieren Breitenkreis auf der Kugeloberflache besitzen. Fur 
eine schnelle Implementierung konnten die Indizes der Nachbarzellen in 
einem ROM fur alle Zellen gespeichert werden, solange M 9 nicht zu groli ist. 

Da lineare Pradiktion mit in den Optimierungsprozess einbezogen ist, ist das 
resultierende SNR manchmal grofter als es durch die Addition der Gewinne 
(in dB) aus spharisch logarithmischer Quantisierung und Pradiktion (DPCM) 
vorhergesagt werden kann. Besonders fur den Fall kleiner Raten (z.B. R < 5 
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bit/Abtastwert) sind bemerkenswerte SNR-Gewinne beobachtbar, was 
nachfolgend und in Fig. 6 beschrieben wird. Ein analytisches Ergebnis fur das 
durch diesen Algorithmus erzielbare SNR ist den Autoren derzeit nicht 
bekannt. 

Simulationen zeigten, dass die im Mittel erforderliche Zahl an Iterationen bei 
ca. 0,25 (pro D Abtastwerte) liegt, und bereits bei einer Beschrankung auf 
max. 3 Iterationen keine signifikanten Verluste im Vergleich zu einem 
unbeschrankten Suchraum zu verzeichnen sind, so dass die Suche nach der 
optimaien Quantisierungszelle fur niedrige Dimensionszahlen durchaus in 
Echtzeit impiementierbar ist. Daruber hinaus liefern bereits kleine Werte von D 
grofie Gewinne, siehe Fig. 3 und 6. 

Empfangsseitig ergibt sich keinerlei Anderung gegenuber ublichen DPCM- 
Verfahren. An dieser Stelle soli darauf hingewiesen werden, dass die 
Gesamtverzogerung des Ubertragungssystems lediglich D Abtastwerte 
betragt und es sich somit fur Ubertragungen, welche den Anforderungen einer 
extrem kurzen Verzogerung entsprechen mussen, hervorragend eignet. 

Nachfolgend werden Varianten des Verfahrens naher beschrieben. 

Zur Beschleunigung der Suche nach der gunstigsten Quantisierungszelle, die 
zu einer minimalen Verzerrung z.B. gemali (35) fuhrt, sind prinzipiell alle 
Algorithmen der sog. Lattice-Decodierung bzw. zur Auffindung eines 
Maximum-Likelihood-Codeworts bei der Kanalcodierung anwendbar, vgl. z.B. 
Erik Agrell, Thomas Eriksson, Alexander Vardy, Kenneth Zeger. Closest Point 
Search in Lattices. IEEE Transactions on Information Theory, pp. 2201-2214, 
Aug. 2002 und die dort angegebenen Referenzen. Dabei ist vorzugsweise 
eine Transformation dieser Verfahren in Kugelkoordinaten vorzunehmen. 

Eine Variante ohne iterative Bestimmung der Quantisierungszelle ist dadurch 
gegeben, dass anstelle einer Berucksichtigung statistischer Abhangigkeiten 
innerhalb der aktuell zur Quantisierung anstehenden D Signalwerte durch ein 
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lineares Pradiktionsfilter gemali Fig. 5 (also DPCM), eine nichtgleichmafiige 
Quantisierung der Winkelkoordinaten vorgenommen wird. Dabei sind die 
linearen statistischen Bindungen der aktuell zur Quantisierung anstehenden D 
Signalwerte zu vergangenen Signalwerten mittels klassischer DPCM mit 
Ruckwartspradiktion zu nutzen. Es entsteht also eine Ruckwartspradiktion, bei 
der nach D Signalwerten eine Aktualisierung des Pradiktionsfilters um D 
Schritte erfolgt. 

Es wird vorgeschlagen, die logarithmische Quantisierung des Betrags aufrecht 
zu erhalten, so dass anschliefiend die Signalpunkte so normiert werden 
konnen, dass sie auf einer Kugel mit Radius 1 liegen. Dies erlaubt die 
analytische Berechnung der Wahrscheinlichkeitsdichtefunktion der 
Signalpunkte auf der. Kugeloberflache, z.B. bei Annahme eines gaufi'schen 
Signalprozesses aus der Autokorrelationsfunktion des Quellensignals, bzw. 
eine direkte experimentelle Ermittlung von relativen Haufigkeiten der 
Signalpunkte auf der Kugeloberflache. 

Fur M » 1 lasst sich hieraus z.B. mit Hilfe des Optimierungsansatzes nach [9] 
eine nichtgleichmaflige kubische Quantisierung der Oberflache einer Kugel 
mit Radius 1 bestimmen. Dieser Ansatz besagt, dass im Mittel der Beitrag 
jeder Quantisierungszelle zum Quantisierungsgerausch gleich sein soil. 
Bezeichnet A, die Kantenlange einer (D - 1)-dimensionalen kubischen 
Quantisierungszelle sowie z, den dazugehorigen Mittelpunkt, also den 
empfangsseitigen Rekonstruktionsvektor mit dem Betrag 1 , sowie f(v); v := 
(^.....^D-^die Wahrscheiniichkeitsdichtefunktion bzw. relative Haufigkeit von 

Signalwerten auf der Kugeloberflache, so soli also naherungsweise erfullt 
sein: 
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A 2 



(^-l)^-/(^)-Af-' = const. (36) 



mit derNebenbedingung jAf' 1 = fi D (37) 



1=1 



Hieraus folgt unmittelbar eine (D - 1)-dimensionale Kompressor-Funktion 
k{v) t durch welche die ungleichmafiige Quantisierung der Kugeloberflache 
eindeutig bestimmt wird. Die ungleichmafiige Quantisierung kann dann 
beispielsweise wie im eindimensionalen Fall durch eine nichtlineare 
Verzerrung des Vektors v in einen Vektor z:=k(v), anschliefiende 
gleichmafiige Quantisierung zum Vektor z. gemaft Abschnitt lll-C und 
Anwendung der Umkehrfunktion P:=*"'(z f ) nachfolgend zur Gewinnung des 
Rekonstruktionsvektors vollzogen werden. 

Vorzugsweise ist die resultierende (D - 1) -dimensionale Kompressorfunktion 
durch eine analytisch beschreibbare Funktion anzunahern, oder, analog zu 
der bei der eindimensionalen Kompression ublichen Darstellung mittels 
Geradenstucke (z.B. 13-Segment-Kennlinie, siehe [5]), durch (D - 2)- 
dimensionale Teilebenen (mit konstanten partiellen Ableitungen) zu 
approximieren. Bei einer uber dem Raum 



orthogonalen Rasterung dieser Approximation uber den D - 1 Winkeln kann 
eine einfache Auswertbarkeit der Kompressorfunktion erreicht werden. 

Zur Simulation von spharisch logarithmischer Quantisierung in Kombination 
mit DPCM wurde die Quantisierung der Ouverture sowie der Arie "Der 
Vogelfanger bin ich ja" der Oper w Zauberflfite" von Wolfgang Amadeus Mozart 
(vgl. Philips Classics Pruductions 1994 (DDD): Mozart: "Der Vogelfanger bin 
ich ja" (Die Zauberflote). Polygram Records #442569-2, Track 3) untersucht. 
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Fig. 6 zeigt Simulationsergebnisse fur R = 3, R = 4 und R = 7 bit/Abtastwert 
bei A = 102726, A = 48270, A = 4858 sowie verschiedenen 
Dimensionszahlen D. 

Das Signal wurde zuerst codiert, anschlieliend decodiert und das SNR durch 
Vergleich mit dem originalen CD-Signal berechnet. Der Storabstand ist hier 
jeweils Ober das gesamte Musikstuck gemittelt. Bei den niedrigen Raten steigt 
das SNR mit D im Vergleich zu Fig. 3 noch steiler an, Ursache hierfur ist eine 
verbesserte Mittelwertbildung. Beim Vergleich der Ergebnisse sind die 
verschiedenen Werte das Parameters A zu beachten. Die Arie „Vogelfanger" 
ist mit einem mittleren Signalpegel von -32,15 dB auf Audio-CD gespeichert 
und bietet aufgrund von Signaldynamik und Klangfarben (Vorspiel, Gesang, 
Rohrfldte) ein anspruchsvolles Beispiel zur Audiosignalcodierung. Da hier ein 
universelles Pradiktorfilter niedriger Ordnung (P = 2) verwendet wurde, 
konnen diese Simulationsergebnisse als reprasentativ fur eine Vielzahl von 
Audiosignalen betrachtet werden. 

Fig. 6 zeigt die gemessenen Stbrabstande, gemittelt uber das ganze 
Musikstuck. Aus einem Vergleich der Fig. 3 (oder (1)) und Fig. 6 bei D = 1, R 
= 7 ist offensichtlich, dass der mittlere Pradiktionsgewinn fiir diesen einfachen 
Pradiktor etwa 20 dB bis 23 dB betragt (Abtastfrequenz: 44,1 kHz!). Bei R = 7 
wird der Gesamtgewinn bei alien Werten von D gut durch die Summe der 
beiden Einzelgewinne aus spharisch logarithmischer Quantisierung und 
DPCM approximiert, wobei dies bei R = 4 nur fur D > 5 gilt. (Selbstverstandlich 
ist (1) nicht anwendbar fur beispielsweise R = 3 oder R = 4 und D = 1, A = 
48270.) 

Der mittlere Signalpegel der Ouverture liegt bei -27,20 dB; dieses Musikstuck 
ist durch einen sehr groflen Dynamikbereich von unterhalb -70 dB bis -17 dB 
charakterisiert, siehe auch Fig. 7. In Fig. 7 ist der segmentweise Signalpegel 
sowie die SNRs fur das Beispiel Ouverture aufgetragen; jedes Segment 
besteht aus 6000 Abtastwerten und entspricht somit einem Zeitbereich von 
0,136 s. Hier wurde spharisch logarithmische Quantisierung in D = 3 
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Dimensionen mit A =1014 und A = 4858 sowie in D = 6 Dimensionen mit A 
= 48270 und dem gleichen Kompromiss-Pradiktor der Ordnung P = 2 wie im 
ersten Beispiel angewendet. Die obere Kurve zeigt die grofce Dynamik, 
hervorgerufen durch die bekannten lauten Tone getrennt durch 
Generalpausen iiber mehrere Takte zu Beginn und in der Mitte dieses 
popularen Musikstucks. Die Kurven fur A =1014 und A = 4858 offenbaren 
den Vorteil eines wachsenden A bzgl. des segmentweisen SNR, man 
beachte hier insbesondere die Generalpausen. Die untere Kurve in Fig. 7 
demonstriert diesen Aspekt fur eine weitere Erhohung von A und dem damit 
verbundenen weiteren SNR-Gewinn von 3 dB aufgrund der hoheren 
Dimensionszahl D = 6 (siehe auch Fig. 3). Es gilt zu beachten, dass trotz der 
niedrigen Rate von R = 4 bit/Abtastwert ein 10 log f0 (SNR) >35dB (bzgl. der 
originalen CD) selbst in den Generalpausen aufrecht erhalten wird. 

Der Wert A = 48270 entspricht einer Komprimierung urn 12 bits, z.B. fur D = 
1. R = 12 wird eine Auflosung von 24 bits fur kleine Signalwerte erzielt. 
Selbstverstandlich ist fur D = 1 , R = 4 wegen der zu geringen Intervallanzahl 
eine Auflosung entsprechend 16 bit niemals vorhanden^ Aber bei Anwendung 
spharisch logarithmischer Quantisierung in 6 Dimensionen ist der extrem 
grofie Wert von A = 48270 fur einen hohen Minimalwert des SNR tatsachlich 
gut gewahlt. Fur diesen Fall ist die Auflosung sogar identisch mit derjenigen 
der originalen CD-Daten fur Segmente mit einem Signalpegel von -70 dB und 
niedriger. Bisher wurde selbst unter trainierten Personen niemand gefunden, 
der in der Lage war, zuverlassig einen Unterschied zwischen dem 
quantisierten Signal bei R = 4, D = 6, A = 48270 und dem Originalsignal zu 
horen. 

Vorstehend wurde ein wellenformerhaltendes Digitalisierungsverfahren fur 
analoge Quellensignale gezeigt, das zum einen den Gewinn durch 
mehrdimensionale Quantisierung mit den Vorteilen der logarithmischen 
Quantisierung verknupft und zum anderen in der Lage ist, den objektiven 
Stdrabstand durch Addition von Pradiktionsgewinnen zusatzlich zu erhdhen. 
Abschlieliend sei angemerkt, dass sich dieses Verfahren neben einem 
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gunstigen Austausch von Rate und Verzerrung vor allem durch einen extrem 
grofien Dynamikbereich bei einer gleichzeitig aulierst geringen 
systembedingten Verzogerung des Signals um nur wenige Abtastintervalle 
auszeichnet. 
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Anspruche 

Verfahren zur Digitalisierung analoger Quellensignale, mit dem Schritt: 
- Durchfuhren einer D-dimensionalen spharisch logarithmischen 
Quantisierung der analogen Quellensignale. 

Verfahren nach Anspruch 1, wobei 

eine Transformation der Quellensignale in Kugelkoordinaten 
durchgefuhrt wird. 

Verfahren nach Anspruch 2, wobei 

eine logarithmische Quantisierung des Betrages in Kugelkoordinaten 
erfolgt. 

Verfahren nach Anspruch 2 oder 3, wobei 

eine ungleichmaflige Quantisierung der Winkelkoordinaten der 
Kugelkoordinaten durchgefuhrt wird. 

Verfahren nach Anspruch 1, mit den Schritten: 

- Quantisieren der analogen Quellensignale in Polarkoordinaten, 
wobei der Betrag der Quellensignale in Polarkoordinaten 
logarithmisch quantisiert wird, und wobei die Quantisierung des 
Winkels in Polarkoordinaten der analogen Quellensignale in 
Abhangigkeit der quantisierten Winkel hoherer Ordnung erfolgt. 

Verfahren nach Anspruch 5, wobei 

die Quantisierung einer D-dimensionalen Kugel mit einem 
Einheitsradius durch ein Netz aus D - 1-dimensionalen Wurfeln 
erfolgt. 
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Verfahren nach Anspruch 5 oder 6, wobei 

diejenigen Quantisierungszellen ausgewahlt werden, welche auf der 
Oberflache einer Kugel mit Einheitsradius liegen, wobei die 
Quantisierungszellen D- 1-dimensionale Wurfel darstellen. 

Verfahren zur Komprimierung analoger Signale, mit den Schritten: 

Durchfuhren einer Digitalisierung analoger Quellensignale gemali 
einem Verfahren nach einem der Anspruche 1 bis 7, und 
Durchfuhren einer differenziellen Pulscodemodulation. 

Verfahren nach Anspruch 8, mit den Schritten 

- Durchfuhren einer Vorwartspradiktion zur Ermittlung eines 
Startwertes fur Abtastwerte der Quantisierung auf der Basis des 
aktuellen Zustandes eines Pradikatorfilters, 

- Rekonstruktion der nachfolgenden D Abtastwerte, 

- Durchfuhren einer D-dimensionalen logarithmischen spharischen 
Quantisierung der durch die Vorwartspradiktion erhaltenen Werte, 
urn eine Startzelle zu bestimmen, 

- iteratives Durchlaufen der Pradiktion der differenziellen 
Pulscodemodulation, urn eine Quantisierungszelle mit dem 
geringsten Quantisierungsfehler zu bestimmen. 

Verfahren nach Anspruch 8 oder 9, wobei 

eine Lattice-Decodierung zur Bestimmung einer gunstigen 
Quantisierungszelle durchgefuhrt wird. 

Verfahren nach einem der Anspruche 8 bis 10, wobei 

eine Ruckwartspradiktion einer differentiellen Pulscodemodulation 
durchgefuhrt wird, wobei nach der Verarbeitung von D Abtastwerten 
eine Aktualisierung des Pradiktionsfilters urn D Schritte erfolgt. 
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Vorrichtung zur Digitalisierung analoger Quellensignale, mit 
- einer D-dimensionalen spharisch logarithmischen 

Quantisierungseinrichtung. 

Vorrichtung nach Anspruch 12, mit 

einer Transformationseinrichtung zur Durchfuhrung einer 
Transformation der analogen Quellensignale in Kugelkoordinaten. 

Vorrichtung nach Anspruch 12 Oder 13, wobei 

eine logarithmische Quantisierung des Betrages erfolgt. 

Vorrichtung nach Anspruch 13 Oder 14, wobei 

eine ungleichmaliige Quantisierung der Winkelkoordinaten der 
spharischen oder Kugelkoordinaten durchgefuhrt wird. 

Vorrichtung zur Komprimierung analoger Signale mit einer Vorrichtung 
zur Digitalisierung analoger Signale nach einem der Anspruche 12 bis 
15, und einem Encoder fur differenzielle Pulscodemodulation. 

Vorrichtung nach Anspruch 16, mit 

- einer Vorwartspradiktionseinrichtung zur Ermittlung eines Startwertes 
fur die Abtastwerte der Quantisierung auf der Basis des aktuellen 
Zustandes eines Pradikatorfilters, 

- einer Rekonstruktionseinrichtung zur Rekonstruktion der 
nachfolgenden D Abtastwerte, 

- einer D-dimensionalen logarithmischen spharischen 
Quantisierungseinrichtung zur Quantisierung der durch die 
Vorwartspradiktion erhaltenen Werte, urn eine Startzelle zu 
bestimmen, 

wobei die Pradiktion der differenziellen Pulscodemodulation iterativ 
durchlaufen wird, urn eine Quantisierungszelle mit dem geringsten 
Quantisierungsfehler zu bestimmen. 
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Vorrichtung nach Anspaich 17 oder 18, wobei 

eine Lattice-Decodierungseinrichtung zur Bestimmung einer 
gunstigen Quantisierungszelle durchgefuhrt wird. 

Vorrichtung nach einem der Anspruche 17 bis 19. wobei 

eine Ruckwartspradiktion einer differentiellen Pulscodemodulation 
durchgefuhrt wird, wobei nach der Verarbeitung von D Abtastwerten 
eine Aktualisierung des Pradiktionsfilters urn D Schritte erfolgt. 
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Zusammenfassunq 

Die Erfindung beruht auf dem Gedanken, ein Verfahren zur hochauflosenden, 
wellenformerhaltenden Digitalisierung analoger Signale vorzusehen, wobei die 
ubliche skalare logarithmische Quantisierung auf mehrdimensionale 
Kugeikoordinaten ubertragen wird und sich somit die hieraus resultierenden 
Vorteile wie z.B. ein konstanter Storabstand uber einen extrem hohen 
Dynamikbereich bei einem sehr geringen Verlust in Bezug auf die Rate- 
Distortion-Theorie ergeben. Urn die im Quellensignal vorhandenen 
statistischen Abhangigkeiten fur einen weiteren Storabstandsgewinn 
ausnutzen zu konnen, wird die Differentielle Pulscodemodulation (DPCM) mit 
spharisch logarithmischer Quantisierung kombiniert. Das resultierende 
Verfahren erzielt eine wirksame Datenreduktion mit einem hohen Langzeit- 
sowie Kurzzeitstorabstand bei extrem geringer Signalverzogerung. 
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